Mediante la exploración y visualización de datos, se evidenció ….
Todo delito trae consigo una serie de inconvenientes o sufrimiento para una o más personas. Por esto y más siempre ha sido de interés para el humano el estudio de diversos delitos. Lo ideal sería poder predecir estos actos para así evitar los daños generados, pero lamentablemente esto no es posible debido a la gran aleatoriedad de los actos de las personas. Aunque no se puede tener certeza de que se cometerá un delito, sí se puede tratar de encontrar un patrón espacial.
Es por esto que buscamos analizar los distintos niveles de delitos por comuna de la Región Metropolitana y relacionarlos con distintas variables comunales, como son el porcentanje de hacinamiento, la cantidad de habitantes por vivienda, el índice de masculinidad poblacional, nivel de escolaridad del jefe de hogar, entre otras. Queremos responder preguntas como ¿Existirán patrones identificables de los tipos de delitos según las diversas variables comunales? ¿Hay relación entre algunos delitos y el nivel de de hacinamiento? ¿Tiene incidencia el nivel educacional del jefe de hogar? ¿Qué delitos sí y cuáles no?
Además, dado que tenemos información espacial ¿Podremos predecir futuros lugares conflictivos según la evidencia de evolución temporal? o ¿Existirán relaciones en los resultados alcanzados entre las unidades vecinales (comunas)?
Las conclusiones obtenidas podrían usarse para que cada comuna genere medidas preventivas desde su realidad, al tomar conocimiento de las variables que propician estos delitos.
En este estudio utilizaremos los datos del Centro de Estudios y Análisis del Delito CEAD para los delitos clasificados como: Consumo de alcohol en la vía pública, ruidos molestos, abusos sexuales y otros delitos sexuales, violencia intrafamiliar contra el adulto mayor, contra la mujer y contra el niño. También, usaremos datos del CENSO 2017 provenientes de INE.
En las siguientes tablas podremos ver la descripción de nuestras variables a estudiar:
| Variable | Tipo de variable | Descripción |
|---|---|---|
| COMUNA | Categórica | Nombre de la comuna |
| ALCOHOL | Numérica | Cantidad de denuncias por delitos de consumo de alcohol en la vía pública |
| RUIDO | Numérica | Cantidad de denuncias por delitos de ruidos molestos |
| ABUSO | Numérica | Cantidad de denuncias por abusos sexuales y otros delitos sexuales |
| VIO.ADULT | Numérica | Cantidad de denuncias por delitos de violencia intrafamiliar a adulto mayor |
| VIO.MUJ | Numérica | Cantidad de denuncias por delitos de violencia intrafamiliar a mujer |
| VIO.NIN | Numérica | Cantidad de denuncias por delitos de violencia intrafamiliar a niño/a |
| ANIO | Numérica | Año de las denuncias (2010 al 2017) |
| Variable | Tipo de variable | Descripción |
|---|---|---|
| Comuna | Categórica | Nombre de la comuna |
| POB | Numérica | Número de habitantes |
| VIV | Numérica | Número de viviendas |
| HACI | Numérica | Porcentaje de viviendas con hacinamiento |
| MASCU | Numérica | Índice de Masculinidad (hombres cada 100 mujeres) |
| ESC | Numérica | Años de escolaridad promedio del jefe o jefa de hogar |
Adicionalmete para la base CENSO 2017, se generó una nueva variables ´Pob_Viv´ que resume la población y la cantidad de viviendas de la comuna.
Iniciaremos nuestra investigación realizando un análisis previo mediante visualizaciones para observar posibles patrones, asociaciones y correlaciones a través de cartogramas y corrplots, además de usar diversos test de asociación espacial.
Posteriormente, construiremos modelos lineales, CAR y SAR para cada una de las variables de Delitos. Las cuales serán construidas con diferentes variables, en donde identificaremos si es que existe alguna incidencia con nuestra poblacional.
Para tener una panorámica de la situación, observemos a través de cartogramas las variables poblacionales del CENSO 2017
De la Figura 1, podemos notar que para las variables HACI (hacinamiento) y Pov_Viv poseen una mayor condensación en el centro de las comunas de la región metropolitana. Notemos que para la variable MASCU (hombres cada 100 mujeres) existe una mayor tasa en comunas rurales.
Analicemos la existencia de autocorrelación espacial
| Variable | Moran_I_statistic | Expectation | Variance |
|---|---|---|---|
| Hacinamiento | 0.3215536 | -0.0196078 | 0.0062550 |
| Pob_Viv | 0.3086284 | -0.0196078 | 0.0062333 |
| MASCU | 0.2018453 | -0.0196078 | 0.0059165 |
| ESC | 0.5088722 | -0.0196078 | 0.0061381 |
| Variable | Moran_I_statistic | Expectation | Variance |
|---|---|---|---|
| Hacinamiento | 0.6564860 | 1 | 0.0096504 |
| Pob_Viv | 0.7142005 | 1 | 0.0099657 |
| MASCU | 0.6455465 | 1 | 0.0145702 |
| ESC | 0.4495425 | 1 | 0.0113497 |
De las tablas I y II, podemos desprender que para todas nuestras variables existe autocorrelación espacial.
Al igual que para la base anterior, realizaremos cartogramas para nuestra base Delitos. Dado que tenemos información desde el año 2010 hasta el 2017, se presentan a continuación animaciones del avance tras pasan los años para cada uno de los delitos denunciados que estamos estudiando
Figura 2: Cartograma denuncias abuso sexual
De la Figura 2, podemos notar que para el año 2012 se presentan más comunas con denuncias de esta índole. Además, cabe destacar que las comunas: Puente Alto, Maipú y Santiago centro permanecen en color amarillo y poseen pocas variaciones a lo largo de los años.
Figura 3: Cartograma denuncias de consumo de alcohol en la vía pública
De la Figura 3, podemos notar que la comuna de Santiago centro posee la mayor cantidad de denuncias por consumo de alcohol en la vía pública. Además, se observa un leve aumento en las comunas aledañas a Santiago centro tras pasar los años.
Figura 4: Cartograma denuncias de ruidos molestos
De la Figura 4, podemos notar que las denuncias con respecto a ruidos molesto ha disminuido un poco a lo largo de los años, dejando a la comuna de Las Condes y Puente Alto como las con mayores denuncias.
Figura 5: Cartograma de violencia hacia los niños y niñas
Con respecto a las denuncias de violencia hacia niños y niñas, podemos notar en la Figura 5 que estas han disminuido un poco al pasar los años. Las comunas con más denuncias de esta índole son Puente Alto, San Bernardo y Maipú.
Figura 6: Cartograma denuncias de violencia hacia la mujer
De la Figura 6, podemos notar que lamentablemente las denuncias por violencia hacia las mujeres se ha tenido una muy leve disminución al pasar los años.
Figura 7: Cartograma de violencia hacia los adultos mayores
De la Figura 7, podemos observar que ha aumentando la cantidad de denuncias por violencia hacia los adultos mayores. Las comunas de Puente ALto y San Bernardo poseen una mayor cantidad de denuncias.
Ahora bien, ¿Existirá algún tipo de autocorrelación espacial? Realicemos el análisis mediante el test de Moran y Geary para cada uno de estos años y variables:
| Anio | Moran_I | p_value | autocorr |
|---|---|---|---|
| 2010 | 0.0595747 | 0.1458961 | NO |
| 2011 | 0.0699195 | 0.1131303 | NO |
| 2012 | 0.0765915 | 0.0950411 | SI |
| 2013 | 0.0678272 | 0.1183752 | NO |
| 2014 | 0.0775098 | 0.0926427 | SI |
| 2015 | 0.0685166 | 0.1110256 | NO |
| 2016 | 0.0421538 | 0.1950433 | NO |
| 2017 | 0.0466795 | 0.1758531 | NO |
Podemos ver en la tabla III que solo para dos años observamos autocorrelación espacial.
| Anio | Moran_I | p_value | autocorr |
|---|---|---|---|
| 2010 | 0.0705530 | 0.1174070 | NO |
| 2011 | 0.0580571 | 0.1450933 | NO |
| 2012 | 0.0781032 | 0.0902155 | SI |
| 2013 | 0.0868518 | 0.0771651 | SI |
| 2014 | 0.0527745 | 0.1641984 | NO |
| 2015 | 0.0613794 | 0.1364900 | NO |
| 2016 | 0.0357699 | 0.2279101 | NO |
| 2017 | 0.0499959 | 0.1769099 | NO |
Podemos ver en la tabla IV que solo para dos años observamos autocorrelación espacial.
| Anio | Moran_I | p_value | autocorr |
|---|---|---|---|
| 2010 | 0.1343204 | 0.0258065 | SI |
| 2011 | 0.2296126 | 0.0007910 | SI |
| 2012 | 0.1635166 | 0.0099519 | SI |
| 2013 | 0.2470654 | 0.0003723 | SI |
| 2014 | 0.1986394 | 0.0021182 | SI |
| 2015 | 0.1204189 | 0.0348804 | SI |
| 2016 | 0.1259954 | 0.0316182 | SI |
| 2017 | 0.1631589 | 0.0097908 | SI |
Podemos ver en la tabla V que la variable VIO.ADULT presenta autocorrelación espacial para todos los años que se observó.
| Anio | Moran_I | p_value | autocorr |
|---|---|---|---|
| 2010 | 0.1052217 | 0.0182566 | SI |
| 2011 | 0.0828977 | 0.0674337 | SI |
| 2012 | 0.0420618 | 0.1489845 | NO |
| 2013 | 0.1109669 | 0.0211804 | SI |
| 2014 | 0.1265328 | 0.0013710 | SI |
| 2015 | 0.0364833 | 0.1457667 | NO |
| 2016 | 0.0908055 | 0.0487144 | SI |
| 2017 | 0.1781791 | 0.0010787 | SI |
Podemos ver en la tabla VI que la variable ALCOHOL presenta autocorrelación espacial para 6 de los 8 años.
| Anio | Moran_I | p_value | autocorr |
|---|---|---|---|
| 2010 | 0.0612020 | 0.1477310 | NO |
| 2011 | 0.0954627 | 0.0680161 | SI |
| 2012 | 0.0721176 | 0.1155009 | NO |
| 2013 | 0.0719848 | 0.1163297 | NO |
| 2014 | 0.0252440 | 0.2752188 | NO |
| 2015 | 0.0576860 | 0.1570591 | NO |
| 2016 | 0.0371657 | 0.2273989 | NO |
| 2017 | 0.0278811 | 0.2638431 | NO |
Podemos ver en la tabla VII que la variable ABUSO presenta autocorrelación espacial sólo para 1 año.
| Anio | Moran_I | p_value | autocorr |
|---|---|---|---|
| 2010 | 0.0144525 | 0.3165029 | NO |
| 2011 | -0.0439589 | 0.6339855 | NO |
| 2012 | -0.0413161 | 0.6213840 | NO |
| 2013 | -0.0234342 | 0.5199303 | NO |
| 2014 | -0.0504665 | 0.6564777 | NO |
| 2015 | -0.0016898 | 0.4080358 | NO |
| 2016 | -0.0464047 | 0.6407996 | NO |
| 2017 | -0.0762835 | 0.7708874 | NO |
Podemos ver en la tabla VIII que la variable RUIDO no presenta autocorrelación espacial en ninguno de los años observados.
Ahora veamos la correlación de los datos a través de un corrplot ¿Qué tan relacionadas linealmente estarán nuestras variables?
knitr::include_graphics(here::here("Informe","Corrplot.png"))Figura 8: Corrplot
De la Figura 2, podemos notar que las variables POB,VIV, ABUSO, VIO.MUJ y VIO.NIN poseen una asociación muy alta. Podríamos decir que a medida que hay mayor población o viviendas, encontraremos una mayor cantidad de denuncias con respecto a la violencia y abuso.
Se propuso el modelo completo con las variables comunales HACI, MASCU, ESCU y Pob_Viv. Y luego se fueron eliminando variables teniendo presente la significancia que tenían en el modelo completo y usando como criterio de eliminación el AIC.
| Modelo | AIC |
|---|---|
| Lineal Completo | 6410.272 |
| Lineal MASCU + Pob_Viv | 6407.642 |
| CAR MASCU + Pob_Viv | 6244.973 |
| SAR Completo | 6249.190 |
Para el delito de violencia hacia la mujer el mejor modelo es el CAR con las variables MASCU y Pob_Viv. Por lo que sí estaría incidiendo en este delito la cantidad de habitantes por vivienda Así como también la cantidad de hombres en la comuna.
| Modelo | AIC |
|---|---|
| Lineal Completo | 4162.228 |
| Lineal MASCU + Pob_Viv | 4159.743 |
| CAR Completo | 3989.597 |
| SAR Completo | 4003.238 |
Para el delito de violencia hacia adulto mayor el mejor modelo es el CAR con todas las variables. Por lo que sí estaría incidiendo en este delito los niveles de hacinamiento y la cantidad de habitantes por vivienda. Además de la cantidad de hombres en la comuna y el nivel de escolaridad de los jefes o jefas de hogar.
| Modelo | AIC |
|---|---|
| Lineal Completo | 3218.644 |
| Lineal HACI + MASCU | 3216.932 |
| CAR Completo | 3074.503 |
| CAR MASCU + ESC | 3070.604 |
| SAR Completo | 3080.396 |
| SAR MASCU + ESC | 3077.439 |
Para el delito de violencia hacia adulto mayor el mejor modelo es el CAR con las variables MASCU y ESC. Por lo que no estaría incidiendo en este delito los niveles de hacinamiento o la cantidad de habitantes por vivienda. Pero sí la cantidad de hombres en la comuna y el nivel de escolaridad de los jefes o jefas de hogar.
| Modelo | AIC |
|---|---|
| Lineal Completo | 7131.373 |
| Lineal HACI + ESC + Pob_Viv | 7131.201 |
| CAR Completo | 7094.734 |
| CAR HACI+ ESC + Pob_Viv | 7092.768 |
| SAR Completo | 7127.345 |
| SAR HACI+ ESC + Pob_Viv | 7125.494 |
Para el delito de beber alcohol en la vía pública el mejor modelo es el CAR con las variables HACI, ESC y Pob_Viv. Por lo que sí estaría incidiendo en este delito los niveles de hacinamiento o la cantidad de habitantes por vivienda. Además del nivel de escolaridad de los jefes o jefas de hogar.
| Modelo | AIC |
|---|---|
| Lineal Completo | 4642.634 |
| Lineal HACI + ESC + Pob_Viv | 4641.615 |
| CAR Completo | 4502.860 |
| CAR Pob_Viv | 4497.643 |
| SAR Completo | 4521.311 |
| SAR ESC + Pob_Viv | 4520.786 |
Para el delito de abuso sexual el mejor modelo es el CAR con la variable Pob_Viv. Por lo que en este delito sí estaría incidiendo la cantidad de habitantes por vivienda.
| Modelo | AIC |
|---|---|
| Lineal Completo | 4753.580 |
| Lineal ESC | 4754.726 |
| CAR Completo | 4710.876 |
| CAR MASCU + ESC | 4708.591 |
| SAR Completo | 4729.122 |
| SAR MASCU + ESC | 4725.380 |
Para el delito de ruidos molestos el mejor modelo es el CAR con la variable MASCU + ESC. Por lo que no estaría incidiendo en este delito los niveles de hacinamiento o la cantidad de habitantes por vivienda. Pero sí la cantidad de hombres en la comuna, además del nivel de educación de los jefes o jefas de hogar.